تشخیص هوشمند و خودکار غلط های تایپی در پایگاه داده های بزرگ بدون استفاده از لغت نامه

Authors

الناز زعفرانی معطر

دانشگاه آزاد اسلامی واحد تبریز - گروه مهندسی کامپیوتر محمدرضا فیضی درخشی

دانشگاه تبریز - دانشکده مهندسی برق و کامپیوتر - گروه مهندسی کامپیوتر آزاده روحانی

دانشگاه آزاد اسلامی واحد خسروشاه - گروه مهندسی کامپیوتر

abstract

غلط های تایپی یکی از مشکلات مهم در سیستم های کامپیوتری و سیستم های پایگاه داده ای است. وجود غلط های تایپی در پایگاه داده ها نه تنها از نظر صحت پایگاه داده مشکل ساز هستند، بلکه باعث می شوند به هنگام ضرورت نتوان رکورد واردشده را بازیابی کرد. همین امر گاه باعث می شود که کاربر مجدداً همان رکورد را وارد پایگاه داده نماید که منجر به وجود آمدن افزونگی می گردد. روش های موجود تشخیص غلط ها، مبتنی بر لغت نامه هستند. بدین معنی که از یک لغت نامه بزرگ که همه لغات آن صحیح فرض می شوند استفاده می کنند و اگر کلمه ای در لغت نامه نباشد به عنوان غلط تایپی شناخته می شود. تهیه لغت نامه ای بزرگ و با دقت بالا بسیار پرهزینه و زمان بر است. به علاوه چنین لغت نامه ای مختص یک زمینه خاص (مثلاً محیط پزشکی) است و قابل استفاده و در زمینه های دیگر (مثلاً جامعه شناسی) نیست. در این مقاله روشی ارائه می شود که بدون نیاز به لغت نامه می تواند غلط های تایپی را تشخیص دهد. روش پیشنهادی با چند معیار مرسوم ارزیابی شده است. نتایج آزمایش ها نشان دهنده دقت 93.5 درصدی برای این روش است. علاوه بر دقت بالای روش پیشنهادی، عدم نیاز به لغت نامه یک ویژگی منحصر به فرد برای آن به شمار می رود.

Upgrade to premium to download articles

Sign up to access the full text

Already have an account?login

similar resources

تشخیص هوشمند و خودکار غلط‌های تایپی در پایگاه‌داده‌های بزرگ بدون استفاده از لغت‌نامه

غلط‌های تایپی یکی از مشکلات مهم در سیستم‌های کامپیوتری و سیستم‌های پایگاه‌داده‌ای است. وجود غلط‌های تایپی در پایگاه‌داده‌ها نه تنها از نظر صحت پایگاه‌داده مشکل‌ساز هستند، بلکه باعث می‌شوند به هنگام ضرورت نتوان رکورد واردشده را بازیابی کرد. همین امر گاه باعث می‌شود که کاربر مجدداً همان رکورد را وارد پایگاه‌داده نماید که منجر به وجود آمدن افزونگی می‌گردد. روش‌های موجود تشخیص غلط‌ها، مبتنی بر لغت‌ن...

full text

تصحیح خودکار غلط های تایپی فارسی به کمک شبکه عصبی مصنوعی ترکیبی

Automatic correction of typos in the typed texts is one of the goals of research in artificial intelligence, data mining and natural language processing. Most of the existing methods are based on searching in dictionaries and determining the similarity of the dictionary entries and the given word. This paper presents the design, implementation, and evaluation of a Farsi typo correction system u...

full text

یک پایگاه داده به منظور استفاده در سامانه هوشمند تشخیص شخصیت

گرافولوژی ، علم مطالعه و بررسی شخصیت و خصوصیات فردی بر اساس نوشتن است. آگاهی از این علم میتواند موارد استفاده زیادی در جامعه داشته باشد. در این مقاله، یک پایگاه داده دست نوشته های فارسی برای گرافولوژی و تشخیص هوشمند شخصیت معرفی میشود. داده های جمع آوری شده شامل 140 نمونه دستخط از دو گروه دانشجویان دانشگاه جامع علمی کاربردی و مددجویان زندان شهر سمنان میباشد. ضمن اخذ دستخط، افراد شرکت کننده در ا...

full text

الگوریتم های هوشمند تطابق چهره در پایگاه داده های بزرگ

تطابق چهره بصورت خودکار یکی از کارهای چالش برانگیزی است که در دهمه اخیر توجه زیادی را به خود جلب کرده است. الگوریتم های مختلفی برای تطابق چهره وجود دارند. کارایی این الگوریتم ها روی پایگاه داده های مختلف آزمایش شده است. برای اینکه این الگوریتم ها قابل پیاده سازی و استفاده باشند، باید بتوان از آنها روی پایگاه داده های بززگ استفاده کرد. هنگام اجرا روی پایگاه داده های بزرگ علاوه بر کارایی، زمان اج...

15 صفحه اول

تصحیح خودکار غلط های تایپی فارسی به کمک شبکه عصبی مصنوعی ترکیبی

ارایه راهی برای تصحیح غلط های املایی نگاشته شده توسط انسان یکی از اهداف مورد توجه در دانش هوش مصنوعی، متن کاوی و پردازش زبان طبیعی است. بیشتر روش های موجود برای تصحیح غلط های املایی بر پایه الگوریتم های جست وجو در فرهنگ واژگان و تعیین نسبت شباهت واژگان درست موجود در فرهنگ واژگان با واژه نادرست مورد نظر کار می کنند. در این پژوهش طراحی، پیاده سازی و ارزیابی یک مصحح املایی به کمک شبکه های عصبی مصن...

full text

نارسایی های لغت نامه های روسی به فارسی چاپ ایران

با توجه به اهمیت فرهنگ نویسی، در یک فعالیت تحقیقی فشرده بر آن بوده ایم، وضعیت لغت نامه های روسی- فارسی را بررسی و رویهء استاندارد مناسبی برای تجدید نظر در جهت أرتقاء آن ها جستجو و معرفی کنیم، بررسی های ما نشان می دهد که در لغت نامه های روسی- فارسی , نواقص متعدإی وجودد ارد. اهمیت لغت نامه های تشریحی، دو زبانه، بسامدی، دستوری و متنی در آن است که این ها به عنوان منابع بنیادین، مصالح أولیهء فعال...

full text

My Resources

Save resource for easier access later


Journal title:
مهندسی برق دانشگاه تبریز

جلد ۴۷، شماره ۱، صفحات ۸۱-۹۱

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023